Исследование рынка заведений общественного питания Москвы

Цель исследования - найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего места для открытия заведения общественного питания в Москве.

Заказчик исследования - фонд "Shut Up and Take My Money"

Исследование базируется на данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года.

Обзор данных

Описание данных:

Вывод

Из общей информации, выведенной методом info(), можно сделать следующие выводы:

  1. В данном датафрейме представлена информация о 8406 заведениях общественного питания Москвы.
  2. Больше половины столбцов хранят информацию строкового типа, один столбец информацию типа "целое число", а остальные - вещественные числа.
  3. Столбец seats — количество посадочных мест, необходимо привести к типу int, так как должно быть целое число.
  4. В датасете имеются пропуски, которые будем обрабатывать на этапе предобработки.

Предобработка данных

Изменение типов данных

Привели столбец seats (количество посадочных мест) к типу данных int64.

Обработка дубликатов

Полные дубликаты отсутствуют

Неявные дубликаты категории заведения

Неявные дубликаты в категории заведения не обнаружены.

Неявные дубликаты категории цен

Неявные дубликаты в категории цен в заведении не обнаружены.

Неявные дубликаты в названиях административных районов

Неявные дубликаты в названиях административных районов не обнаружены.

Неявные дубликаты в названии и адресе заведений

Обработка пропусков

Из выведенной информации видно, что пропусков очень много. Больше всего пропусков в столбце со средним чеком чашки кофе. Как в этом столбце, так и в остальных мы не можем предложить логичную замену пропусков. Удалить такое количество данных мы не можем. Поэтому будем анализировать имеющиеся данные.

Создание новых столбцов

Новый столбец с названием улицы

Части адреса разделены запятой, а название улицы указвается на втором месте

Новый столбец с признаком круглосуточной работы

Проверка количественных значений

Общая статистики

По выеденной информации видно следующее:

Средний чек

Как видим, всего одно заведение с нулевым средним чеком. Эту строку можно смело удалять.

Из расчетов видно, что заведений со средним чеком выше 2562,5 руб. всего 1,2 %. Если их удалить, расчеты не сильно исказяться.

Стоимость одной чашки капучино

В датафрейме нашлась всего одна строка, и если внимательно посмотреть, то видно, что здесь была допущена опечатка. Поэтому необходимо исправить верхнюю границу диапозона цены.

Вывод

На этапе предобработки данных была проделана следующая работа:

  1. Проверили типы данных и преобразовали их там, где это было необходимо:
    привели столбец 'seats'(количество посадочных мест) к типу данных int64.

  2. Изучили дубликаты в датафрейме:

  1. Изучили пропуски в датасете:
  1. Создали новые столбцы:
  1. Проверили количественные значения:

Анализ данных

Проанализируем категории заведений

На диаграмме наблюдается следующее распределение категорий заведений:

Анализ количества посадочных мест

По графику и выведенной информации мы видим:

Рассмотрим соотношение сетевых и несетевых заведений

По графику и выведенной информации мы видим, что несетевых заведений общественного питания гораздо больше (62%), чем сетевых (38%).

Исследуем какие категории заведений чаще являются сетевыми

Для рынка общественного питания Москвы характерно следующее распределение сетевых заведений по категориям:

Топ-15 популярных сетей в Москве

Как видим, больше всего из топ-15 на рынке присутствуют заведения из категории "кофейня".

Рассмотрим общее количество заведений и количество заведений каждой категории по районам

По графику можно сделать следующие выводы:

Распределение средних рейтингов по категориям заведений

График показывает следующее:

Фоновая картограмма со средним рейтингом заведений каждого района

Построим фоновую картограмму (хороплет) со средним рейтингом заведений каждого района.

По выведенному хороплету можно сделать вывод:

Обозначим заведения с помощью кластеров

Отобразим все заведения датасета на карте с помощью кластеров средствами библиотеки folium.

Топ-15 улиц по количеству сетевых заведений

По графику можно сделать следующий вывод:

Улицы, на которых находится только один объект общепита

По графику видно, что единственные объекты общепита на улице в большинстве случаев являются несетевыми.

График показывает следующее:

Распределение среднего чека по районам Москвы

Наши расчеты и хороплет позволяют сделать следующие выводы:

Вывод

На этапе исследовательского анализа данных была проделана работа и сделаны следующие выводы:

  1. Посмотрели на распределение заведений общепита по категориям:
  1. С помощью сводной таблицы посчитали медианное количество посадочных мест по категориям и вывели график, который показал следующее:
  1. Рассмотрели соотношение сетевых и несетевых заведений общепита на рынке Москвы

Оказалось что несетевых заведений общественного питания гораздо больше - 62%, чем сетевых - 38%

  1. Исследовали какие категории заведений чаще являются сетевыми
  1. Нашли и вывели топ-15 популярных сетей в Москве
  1. Рассмотрели общее количество заведений и количество заведений каждой категории по районам
  1. Посмотрели на распределение средних рейтингов по категориям заведений и вывели фоновая картограмму со средним рейтингом заведений каждого района
  1. Отобразили все заведения датасета на карте с помощью кластеров средствами библиотеки folium

  2. Нашли топ-15 улиц по количеству заведений:

  1. Нашли улицы, на которых находится только один объект общепита и построили круговую диаграмму
  1. Рассмотрели распределение среднего чека по районам Москвы и построили хороплет

Детализация исследования: открытие кофейни

Основателям фонда «Shut Up and Take My Money» не даёт покоя успех сериала «Друзья». Их мечта — открыть такую же крутую и доступную, как «Central Perk», кофейню в Москве. Будем считать, что заказчики не боятся конкуренции в этой сфере, ведь кофеен в больших городах уже достаточно. Попробуем определить, осуществима ли мечта клиентов.

Посчитаем сколько всего кофеен в датасете

Сколько всего кофеен в датасете? В каких районах их больше всего, каковы особенности их расположения?

По графику и расчетам можно сделать следующие выводы:

Хоропалет подтверждает ранее сделанные выводы.

Рассмотрим есть ли круглосуточные кофейни

Как видно, в Москве есть круглосуточные кофейни, и их насчитывается 58 заведений

Посмотрим какие у кофеен рейтинги и как они распределяются по районам

По расчетам и хороплету сделаем выводы:

На какую стоимость чашки капучино стоит ориентироваться при открытии и почему?

По расчетам и хороплету распределения среднего чека чашки капучино по районам можно сделать выводы:

Вывод

На этапе детализации исследования по открытию кофейни, мы проделали следующую работу:

1.Посчитали сколько всего кофеен в датасете и рассмотрели в каких районах их больше всего

2.Нашли круглосуточные кофейни, их в Москве - 58 заведений

3.Посмотрели какие у кофеен рейтинги и как они распределяются по районам(построили хороплет)

4.Посчитали на какую стоимость чашки капучино стоит ориентироваться при открытии кофейни

Рекомендации

Основываясь на выводах, можно дать следующие рекомендации: